Détection et regroupement automatique de style d'écriture dans un texte
نویسندگان
چکیده
Résumé. La détection de plagiat extrinsèque devient vite inefficace lorsque l’on n’a pas accès aux documents potentiellement sources du plagiat ou lorsque l’on se confronte à un espace aussi vaste que le Web, ce qui est souvent le cas dans les logiciels anti-plagiat actuels. Dès lors la détection intrinsèque devient nettement plus efficace. Dans cet article, nous traitons justement de la détection automatique d’auteurs qui permet de savoir si un passage d’un texte n’appartient pas au même auteur que le reste du texte et donc en théorie de repérer les passages plagiés d’un document. Nous expliquons notre contribution aux procédures déjà existantes et évaluons les limites de notre approche. L’objectif est de permettre la détection et le regroupement de passages d’un document par auteur.
منابع مشابه
Un outil de détection automatique de thèmes
Vu la quantité de documents numériques disponible sur le Web et la nécessité de mettre au point des techniques de recherche efficaces, les systèmes de recherche d'information font de plus en plus appel aux techniques de Traitement Automatique des Langues (TAL) qui exploitent les informations syntaxiques ou sémantiques, dans le but d’améliorer la qualité des résultats fournis par les moteurs de ...
متن کاملDétection et segmentation des blocs de texte manuscrits et imprimés dans des documents complexes
RÉSUMÉ. Dans cet article, nous présentons un système de segmentation des zones de texte imprimées ou manuscrites dans des documents complexes. La méthode réalise une première classification des composantes connexes en tant que texte/non-texte, puis un deuxième étage discrimine les composantes manuscrites des composantes imprimées. Les composantes de texte sont ensuite regroupées en blocs homogè...
متن کاملSystème de traduction automatique statistique Anglais-Arabe
La traduction automatique (TA) est le processus qui consiste à traduire un texte rédigé dans une langue source vers un texte dans une langue cible. Dans cet article, nous présentons notre système de traduction automatique statistique anglais-arabe. Dans un premier temps, nous présentons le processus général pour mettre en place un système de traduction automatique statistique, ensuite nous décr...
متن کاملDétection visuelle d'anomalies de conception
Résumé. De nos jours, les logiciels doivent être flexibles pour pouvoir accommoder d’éventuels changements. Les anomalies de conception introduites durant l’évolution du logiciel causent souvent des difficultés de maintenance. Cependant, la détection d’anomalies de conception n’est pas triviale. La détection manuelle est coûteuse en temps et en ressources, alors que la détection automatique gén...
متن کاملStudy of Domain Dependant Multi-Polarity Words for Document Level Opinion Mining (Influence des marqueurs multi-polaires dépendant du domaine pour la fouille d'opinion au niveau du texte) [in French]
Résumé. Les méthodes de détection automatique de l’opinion dans des textes s’appuient sur l’association d’une polarité d’opinion aux mots des textes, par lexique ou par apprentissage. Or, certains mots ont des polarités qui peuvent varier selon le domaine thématique du texte. Nous proposons dans cet article une étude des mots ou groupes de mots marqueurs d’opinion au niveau du texte et qui ont ...
متن کامل